author:
- A
- B
submission:
- PMIR
- B
year: "2024"
file:
related:
tags: []
review date: 2025-01-03
Summary
날씨 변화 등 Out-of-Distribution(OOD) 상황에서 모노큘러 3D 객체 탐지의 성능 저하 문제를 해결하기 위한 Fully Test-Time Adaptation 방법인 MonoTTA 제안 [p.1 Abstract]
모노큘러 3D 객체 탐지는 단일 RGB 이미지만으로 3D 객체를 탐지하는 중요한 기술이지만, 실제 환경의 OOD 문제로 인해 성능이 크게 저하됨 (예: Sunny → Snow 시나리오에서 46.2 mAP → 0.3 mAP) [p.2 Introduction]
High-score 객체의 신뢰성과 low-score 객체의 negative learning을 결합한 새로운 test-time adaptation 방법 MonoTTA 제안 [p.3 Section 3.2]
KITTI 데이터셋의 13가지 corruptions와 nuScenes의 실제 주야간 시나리오에서 기존 방법 대비 각각 평균 137%와 244%의 성능 향상 달성 [p.4 Section 2]
모노큘러 3D 객체 탐지는 autonomous driving에서 중요하지만, 날씨/카메라 변화로 인한 distribution shift 문제가 심각함 [p.1-2 Introduction]
OOD 상황에서 객체 탐지 점수가 크게 하락하여 false negative가 증가하는 문제 발생 [p.2-3 Section 3.1]
High-score 객체의 신뢰성이 유지된다는 실험적 발견을 기반으로 reliability-driven adaptation 전략 제안 [p.7 Section 3.3]
Low-score 객체들을 negative learning으로 활용하는 noise-guard adaptation으로 과적합 방지 [p.9 Section 3.4]
다양한 실험을 통해 제안 방법이 실제 autonomous driving 시나리오에서도 효과적임을 검증 [p.10-14 Section 4]
모노큘러 3D 객체 탐지의 실제 환경 적용 시 발생하는 문제들:
"prevalent natural corruptions such as weather changes, diminished sharpness, and other factors that introduce noise and contribute to uncalibrated cameras"
OOD로 인한 성능 저하의 심각성:
"the model performance degrades from 46.2 mAP in in-distribution data to 0.3 mAP in Snow and 7.2 mAP in Fog"
자율주행에서의 중요성:
"To reduce the cost of sensors, there is an increasing trend towards implementing autonomous driving systems via Monocular 3D Object Detection"
기존 Test-Time Adaptation의 한계:
"its computation demands at the adaptation stage are prohibitive"
입력 데이터:
기존 접근 방법들:
"some existing methods leverage extra pre-trained depth estimation modules"
기본 개념:
기존 방법들의 특징:
"certain methods tackle data distribution shifts by adapting the batch normalization layer statistics"
Detection Score 하락:
False Negative 증가:
"This decline conflicts with the pre-defined score thresholds of existing detection methods, leading to severe object omissions"
기존 TTA 방법들의 한계:
핵심 아이디어:
"we find that high-score objects are more reliable and relatively stable even in the presence of diverse corruptions"
Adaptive Threshold 메커니즘:
최적화 전략:
"the optimization of high-score objects can also enhance the confidence of the model for relatively low-score objects"
동기:
Negative Learning 전략:
"we randomly choose one of the negative classes of low-score objects and minimize the scores"
Regularization 효과:
minΘˆ LAO(Θˆ) + λLNreg(Θˆ)
# LAO: Adaptive optimization loss
# LNreg: Negative regularization loss
# λ: Balance parameter [p.7 Section 3.2]
학습 파라미터:
"employ the Stochastic Gradient Descent (SGD) optimizer with a half learning rate of the initial rate"
Corruptions 실험:
성능 향상:
실제 시나리오:
성능:
"our MonoTTA brings sufficient average performance improvement on both MonoFlex (6.23 mAP) and MonoGround (8.26 mAP)"